近年来,人们对使用电子病历(EMR)进行次要目的特别感兴趣,以增强医疗保健提供的质量和安全性。 EMR倾向于包含大量有价值的临床笔记。学习嵌入是一种将笔记转换为使其可比性的格式的方法。基于变压器的表示模型最近取得了巨大的飞跃。这些模型在大型在线数据集上进行了预训练,以有效地了解自然语言文本。学习嵌入的质量受临床注释如何用作表示模型的输入的影响。临床注释有几个部分具有不同水平的信息价值。医疗保健提供者通常使用不同的表达方式来实现同一概念也很常见。现有方法直接使用临床注释或初始预处理作为表示模型的输入。但是,要学习良好的嵌入,我们确定了最重要的临床笔记部分。然后,我们将提取的概念从选定部分映射到统一医学语言系统(UMLS)中的标准名称。我们使用与唯一概念相对应的标准短语作为临床模型的输入。我们进行了实验,以测量在公共可用的医疗信息集市(MIMIC-III)数据集的子集中,在医院死亡率预测的任务中,学到的嵌入向量的实用性。根据实验,与其他输入格式相比,基于临床变压器的表示模型通过提取的独特概念的标准名称产生的输入产生了更好的结果。表现最好的模型分别是Biobert,PubMedbert和Umlsbert。
translated by 谷歌翻译
老年人在日常生活中面临的可能危险之一就是下降。闭塞是基于视觉的秋季检测系统的最大挑战之一,并大大降低了其检测性能。为了解决这个问题,我们合成了专门设计的遮挡视频,用于使用现有数据集训练秋季检测系统。然后,通过定义新的成本功能,我们引入了一个使用遮挡和未封闭式视频的秋季检测模型加权训练的框架,该视频可应用于任何可学习的秋季检测系统。最后,我们同时使用非深度和深层模型来评估所提出的加权训练方法的效果。实验表明,在遮挡条件下,提出的方法可以将分类精度提高36%,而对于深层模型,则可以将分类精度提高36%。此外,结果表明,所提出的训练框架还可以显着提高正常未封闭样品的深网的检测性能。
translated by 谷歌翻译
这项工作旨在将有效性考虑到有关是否以及如何在高风险域中构建数据驱动算法的审议。为此,我们将关键概念从有效性理论转化为预测算法。我们描述了问题制定和数据问题中的共同挑战,这些问题危害了预测算法的有效性。我们将这些问题提炼成一系列高级问题,旨在促进和记录有关预测任务和数据适用性的合法性的思考。这项贡献为共同设计有效性协议的基础与现实世界中的利益相关者合作,包括决策者,建模者和潜在影响社区的成员,以严格评估数据驱动的算法的特定设计的合理性和使用系统。
translated by 谷歌翻译
机器学习(ML)从业人员越来越多地承担着与非技术专家的价值观和目标保持一致的模型。但是,关于从业人员如何将域专业知识转化为ML更新的考虑不足。在本文中,我们考虑如何系统地捕获从业者和专家之间的互动。我们设计了一种分类法,以将专家反馈类型与从业者更新相匹配。从业者可以从观察或域级别的专家那里收到反馈,并将此反馈转换为数据集,损耗函数或参数空间的更新。我们回顾了ML和人类计算机互动中的现有工作,以描述这种反馈更高的分类法,并强调了不足以纳入非技术专家的反馈意见。我们以一系列的开放问题结尾,这些问题自然而然地源于我们提议的分类法和随后的调查。
translated by 谷歌翻译
混合人类ML系统越来越多地负责各种领域的结果决策。越来越多的经验和理论工作已经提出了我们对这些系统的理解。但是,现有的经验结果混合在一起,理论建议通常是互不兼容的。在这项工作中,我们提出了一个理解条件的统一框架,在该框架下,将人类和ML的互补优势结合起来会导致比单独单独产生的决策更高的质量决策 - 我们称之为人类ML互补性。我们专门关注人类ML预测性决策的背景,并研究结合人类和ML预测性决策的最佳方法,这是其判断中基本变化来源的理解。在此范围内,我们提出了两个至关重要的贡献。首先,从心理学,机器学习和人类计算机互动中的先前文献进行决策和借鉴的计算观点,我们引入了一种分类学,描述了人类和机器决策不同的广泛标准。其次,将我们的分类法进行正式化,使我们能够研究人类和ML预测性决策应如何最佳地汇总。我们表明,我们提出的框架包括一些现有的人类ML互补模型作为特殊情况。最后但并非最不重要的一点是,对我们框架的初步探索性分析为未来在人类ML互补性方面的工作提供了关键的见解:我们结合人类和ML判断的机制应由其决策中的基本原因来告知。
translated by 谷歌翻译
Motivated by the growing importance of reducing unfairness in ML predictions, Fair-ML researchers have presented an extensive suite of algorithmic 'fairness-enhancing' remedies. Most existing algorithms, however, are agnostic to the sources of the observed unfairness. As a result, the literature currently lacks guiding frameworks to specify conditions under which each algorithmic intervention can potentially alleviate the underpinning cause of unfairness. To close this gap, we scrutinize the underlying biases (e.g., in the training data or design choices) that cause observational unfairness. We present the conceptual idea and a first implementation of a bias-injection sandbox tool to investigate fairness consequences of various biases and assess the effectiveness of algorithmic remedies in the presence of specific types of bias. We call this process the bias(stress)-testing of algorithmic interventions. Unlike existing toolkits, ours provides a controlled environment to counterfactually inject biases in the ML pipeline. This stylized setup offers the distinct capability of testing fairness interventions beyond observational data and against an unbiased benchmark. In particular, we can test whether a given remedy can alleviate the injected bias by comparing the predictions resulting after the intervention in the biased setting with true labels in the unbiased regime-that is, before any bias injection. We illustrate the utility of our toolkit via a proof-of-concept case study on synthetic data. Our empirical analysis showcases the type of insights that can be obtained through our simulations.
translated by 谷歌翻译
当经过自动化决策时,决策主题将战略性地修改其可观察特征,他们认为可以最大限度地提高收到理想的结果的机会。在许多情况下,潜在的预测模型是故意保密的,以避免游戏并保持竞争优势。这种不透明度迫使决策主题依赖于制定战略功能修改时依赖不完整的信息。我们将这样的设置捕获作为贝叶斯劝说的游戏,其中决策者发送信号,例如动作建议,以便决定受激励他们采取理想的行动。我们制定决策者找到最佳贝叶斯激励兼容(BIC)行动推荐策略作为优化问题的问题,并通过线性程序表征解决方案。通过这种特征,我们观察到,虽然可以显着地简化了找到最佳BIC推荐策略的问题,但是解决该线性程序的计算复杂性与(1)决策主题的动作空间的相对大小紧密相关(2)基础预测模型利用的特征数。最后,我们提供了最佳BIC推荐政策的性能的界限,并表明与标准基线相比,它可能导致任意更好的结果。
translated by 谷歌翻译
认识到没有培训实例的看不见的关系是现实世界中的一个具有挑战性的任务。在本文中,我们提出了一种基于提示的模型,具有语义知识增强(ZS-SKA),以识别零拍摄设置下的看不见的关系。在新的单词级别句子翻译规则之后,我们从带有所看到的关系的情况生成增强的实例。我们根据外部知识图设计提示,以将从所见关系中学到的语义知识信息集成。我们在提示模板中使用实际标签集,而是构造加权虚拟标签单词。通过生成与增强实例的看见和看不见的关系的表示,并通过原型网络提示,计算距离以预测看不见的关系。在三个公共数据集上进行的广泛实验表明,ZS-SKA优于零击方案下的最先进的方法。我们的实验结果还证明了ZS-SKA的有效性和鲁棒性。
translated by 谷歌翻译
在机器学习(ML)算法自动化或提供有关人员的后果决策的环境中,通常会激励个人决策主题以战略性地修改其可观察的属性以获得更有利的预测。结果,对评估规则进行培训的分布可能与其部署中运营的规则不同。尽管这种分配的变化通常可以阻碍准确的预测,但我们的工作确定了由于战略反应而引起的转变相关的独特机会:我们表明我们可以有效地利用战略反应来恢复可观察到的特征与我们希望预测的可观察到的因果关系,即使在没有观察到的混杂变量的情况下。具体而言,我们的工作通过观察到部署模型的序列可以看作是影响代理可观察到的特征但不会直接影响其结果的工具,从而建立了对ML模型的战略响应与仪器变量(IV)回归之间的新颖联系。我们表明,我们的因果恢复方法可用于改善几个重要标准的决策:个人公平,代理结果和预测风险。特别是,我们表明,如果决策主体在修改非毒物属性的能力上有所不同,那么与因果系数偏离的任何决策规则都可能导致(潜在无限)个体级别的不公平性。
translated by 谷歌翻译
我们提出了一个零射门学习关系分类(ZSLRC)框架,通过其识别训练数据中不存在的新颖关系的能力来提高最先进的框架。零射击学习方法模仿人类学习和识别新概念的方式,没有先前的知识。为此,ZSLRC使用修改的高级原型网络来利用加权侧(辅助)信息。 ZSLRC的侧面信息是由关键字,名称实体的高度和标签及其同义词构建的。 ZSLRC还包括一个自动高义的提取框架,可直接从Web获取各种名称实体的高型。 ZSLRC提高了最先进的少量学习关系分类方法,依赖于标记的培训数据,因此即使在现实世界方案中也适用于某些关系对相应标记的培训示例。我们在两种公共数据集(NYT和NEREREL)上使用广泛的实验显示结果,并显示ZSLRC显着优于最先进的方法对监督学习,少量学习和零射击学习任务。我们的实验结果还展示了我们所提出的模型的有效性和稳健性。
translated by 谷歌翻译